💥 20 個 #常見的統計錯誤,你犯過,或是犯了卻不知道嗎?⠀
⠀
MedCalc 的作者 Frank,在 Facebook 分享了一篇跟統計相關的文章,叫做「生物醫學研究文章中,連你都可以發現的 20 個統計錯誤」,很有意思。(連結請見原始貼文)
⠀
我(蔡依橙)認真看完後,覺得蠻不錯的,於是把這 20 個統計錯誤的標題翻成中文,協助大家節省時間,如果剛好有興趣的,可再針對該部分去閱讀原文。接著,分享一些我看完之後的想法。
⠀
⠀
1. 數值報告時,提供了不必要的精確。例如 60 公斤體重,硬要寫成 60.18 公斤。
⠀
2. 將連續變項分組,變成次序變項,但沒有說明為什麼這樣分。像是 CRP 不以數值去統計,而分成低、中、高三組,卻沒說明為什麼這樣分。
⠀
3. 配對資料,只報告各組平均,卻沒報告其改變。也就是只報告治療前血壓、治療後血壓,卻沒報告有多少人上升、多少人下降、平均下降多少。
⠀
4. 描述性統計的誤用,尤其該用 median (interquartile range) 的,硬是用成 mean +- SD。
⠀
5. 使用 standard error of the mean (SEM) 描述量測的精確度,而非 95% CI。
⠀
6. 只報告 p 值,卻沒提到差值以及臨床意義。
⠀
7. 誤用統計方式。尤其常見的是混淆有母數跟無母數統計方法。
⠀
8. 使用線性迴歸,卻沒有先確定資料之間是真的有線性關係。
⠀
9. 沒有使用全部的資料,然後又沒把去掉的資料「為什麼被去掉」說清楚。
⠀
10. 多組比較的 p 值校正問題。
⠀
11. 在隨機分組研究時,過於詳盡地比較了兩組受試者的基本資料,像是性別比例、年齡、體重、血壓等等,而且資料好得太奇怪。
⠀
12. 報告檢驗數值時,沒有定義 normal 與 abnormal。
⠀
13. 計算 sensitivity 與 specificity 時,沒有說明一些介在灰色地帶的檢查結果,如何呈現與去除。
⠀
14. 使用圖片與表格,只是為了儲存數據,而非以協助讀者理解為出發點。
⠀
15. 畫出來的數據圖,視覺主觀上給人的印象,竟然跟數據本身不同。
⠀
16. 在報告數據與解讀時,搞不清楚 units of observation 是什麼,例如心臟病的觀察研究,在 1000 個患者中有 18 位心臟病發,那 units of observation 就是 18。但如果這個研究是以診斷正確率為主,那 sample size 就是 1000。
⠀
17. 把不顯著的統計,或 low power,解讀成 negative,而非 inconclusive。
⠀
18. 分不清楚解釋性研究與實務性研究,前者為 explanatory / efficacy / laboratory,後者為 pragmatic / effectiveness / real world。嘗試兩種混著做,結果兩邊都做不好。
⠀
19. 沒有用臨床能理解的方式來報告最終結果。
⠀
20. 把統計的顯著性,當成臨床的重要性。例如:癌症用新藥治療,統計上很顯著的好,但追蹤了五年,患者只延長了七天的壽命。這就是統計有顯著,但臨床意義不大的例子。
⠀
⠀
🗨 我(蔡依橙)的一些想法
⠀
由統計專業人的角度,來看生物醫學發表,是很有警惕意義的,能讓準備發表的朋友,仔細看看自己是不是也犯了相關的錯誤。
⠀
但另一個角度看,作者也提到,這些錯誤在幾乎一半的生物醫學論文上反覆出現!這就代表,其實生物醫學論文要刊登,並不代表我們什麼錯都不能犯,相反地,這 20 個錯誤裡頭,有些就算犯了,也還是能被刊登。
⠀
以我們自己發表,以及過去協助同學的經驗來說,我會認為 2、7、10、14、15,是初學者也 #必須理解並避開的,其他的則是發表起步了之後,陸陸續續去注意,在往更高分期刊挑戰時,逐漸進步就行。
⠀
實務上,3 分以下的醫學期刊,幾乎沒有專門的統計查核,你只要能通過「一般同行」的統計知識審查就行。也就是說,我是一個放射科醫師,剛開始起步,投稿到放射科 3 分以下期刊,文章中的統計,只要「#一般有在做研究的放射科醫師」覺得可以就行,不見得要到「統計專家看過並挑不出毛病」。
⠀
對於初學者如何起步,實務的協助,新思惟規劃了各種類型的研究課程,歡迎有興趣的朋友可以參考。目前正在開放報名中的,有以下三場工作坊,歡迎您瞭解各課程的課綱後,評估挑選最符合您需求的內容,前來上課,讓我們協助您成功起步。
⠀
🟠 2021 / 11 / 7(日)統合分析工作坊
無經費、資源少也能發表,不用 IRB 且免收案的好選擇。
https://meta-analysis.innovarad.tw/event/
⠀
🔵 2021 / 10 / 17(日)臨床研究與發表工作坊
全新改款!跟著國際學者走,讓你寫作投稿都上手。
https://clip2014.innovarad.tw/event/
⠀
🟢 2021 / 10 / 16(六)個案報告、技術發表與文獻回顧工作坊
把臨床上的各種想法,在 PubMed 化作專業生涯上的里程碑。
https://casereport.innovarad.tw/event/
⠀ ⠀
不只是說說而已,我們會舉實例,說明其意義、如何避開,在互動實作過程,實際由各位在自己的電腦上操作,從數據到軟體,從統計到繪圖,一次搞定,並避開常見錯誤,是真正以 #初學者起步 為核心的規劃。
⠀
⠀
二十個常見的統計錯誤,與實務寫作時的考量。
🔗 原始貼文 │ https://bit.ly/2WESphu
同時也有10000部Youtube影片,追蹤數超過2,910的網紅コバにゃんチャンネル,也在其Youtube影片中提到,...
「sample mean統計」的推薦目錄:
- 關於sample mean統計 在 蔡依橙的閱讀筆記 Facebook 的最佳貼文
- 關於sample mean統計 在 新思惟國際 Facebook 的最讚貼文
- 關於sample mean統計 在 Herman Yeung Facebook 的最讚貼文
- 關於sample mean統計 在 コバにゃんチャンネル Youtube 的精選貼文
- 關於sample mean統計 在 大象中醫 Youtube 的最讚貼文
- 關於sample mean統計 在 大象中醫 Youtube 的最讚貼文
- 關於sample mean統計 在 「機率與統計」05-05「抽樣分佈:A sample mean experiment」 的評價
- 關於sample mean統計 在 「機率與統計」05-04「抽樣分佈:Distribution of the sample ... 的評價
- 關於sample mean統計 在 生物統計學:常讓人誤解的標準誤 - Facebook 的評價
- 關於sample mean統計 在 R 統計軟體(2)-抽樣與敘述統計(作者:陳鍾誠) - GitHub 的評價
- 關於sample mean統計 在 統計學(二) 筆記- 第十章推論兩個平均數或是母體參數(Inference ... 的評價
- 關於sample mean統計 在 mean統計、眾數、眾數定義在PTT/mobile01評價與討論 的評價
- 關於sample mean統計 在 mean統計、眾數、眾數定義在PTT/mobile01評價與討論 的評價
sample mean統計 在 新思惟國際 Facebook 的最讚貼文
💥 20 個 #常見的統計錯誤,你犯過,或是犯了卻不知道嗎?⠀
⠀
MedCalc 的作者 Frank,在 Facebook 分享了一篇跟統計相關的文章,叫做「生物醫學研究文章中,連你都可以發現的 20 個統計錯誤」,很有意思。(連結請見原始貼文)
⠀
我(蔡依橙)認真看完後,覺得蠻不錯的,於是把這 20 個統計錯誤的標題翻成中文,協助大家節省時間,如果剛好有興趣的,可再針對該部分去閱讀原文。接著,分享一些我看完之後的想法。
⠀
⠀
1. 數值報告時,提供了不必要的精確。例如 60 公斤體重,硬要寫成 60.18 公斤。
⠀
2. 將連續變項分組,變成次序變項,但沒有說明為什麼這樣分。像是 CRP 不以數值去統計,而分成低、中、高三組,卻沒說明為什麼這樣分。
⠀
3. 配對資料,只報告各組平均,卻沒報告其改變。也就是只報告治療前血壓、治療後血壓,卻沒報告有多少人上升、多少人下降、平均下降多少。
⠀
4. 描述性統計的誤用,尤其該用 median (interquartile range) 的,硬是用成 mean +- SD。
⠀
5. 使用 standard error of the mean (SEM) 描述量測的精確度,而非 95% CI。
⠀
6. 只報告 p 值,卻沒提到差值以及臨床意義。
⠀
7. 誤用統計方式。尤其常見的是混淆有母數跟無母數統計方法。
⠀
8. 使用線性迴歸,卻沒有先確定資料之間是真的有線性關係。
⠀
9. 沒有使用全部的資料,然後又沒把去掉的資料「為什麼被去掉」說清楚。
⠀
10. 多組比較的 p 值校正問題。
⠀
11. 在隨機分組研究時,過於詳盡地比較了兩組受試者的基本資料,像是性別比例、年齡、體重、血壓等等,而且資料好得太奇怪。
⠀
12. 報告檢驗數值時,沒有定義 normal 與 abnormal。
⠀
13. 計算 sensitivity 與 specificity 時,沒有說明一些介在灰色地帶的檢查結果,如何呈現與去除。
⠀
14. 使用圖片與表格,只是為了儲存數據,而非以協助讀者理解為出發點。
⠀
15. 畫出來的數據圖,視覺主觀上給人的印象,竟然跟數據本身不同。
⠀
16. 在報告數據與解讀時,搞不清楚 units of observation 是什麼,例如心臟病的觀察研究,在 1000 個患者中有 18 位心臟病發,那 units of observation 就是 18。但如果這個研究是以診斷正確率為主,那 sample size 就是 1000。
⠀
17. 把不顯著的統計,或 low power,解讀成 negative,而非 inconclusive。
⠀
18. 分不清楚解釋性研究與實務性研究,前者為 explanatory / efficacy / laboratory,後者為 pragmatic / effectiveness / real world。嘗試兩種混著做,結果兩邊都做不好。
⠀
19. 沒有用臨床能理解的方式來報告最終結果。
⠀
20. 把統計的顯著性,當成臨床的重要性。例如:癌症用新藥治療,統計上很顯著的好,但追蹤了五年,患者只延長了七天的壽命。這就是統計有顯著,但臨床意義不大的例子。
⠀
⠀
🗨 我(蔡依橙)的一些想法
⠀
由統計專業人的角度,來看生物醫學發表,是很有警惕意義的,能讓準備發表的朋友,仔細看看自己是不是也犯了相關的錯誤。
⠀
但另一個角度看,作者也提到,這些錯誤在幾乎一半的生物醫學論文上反覆出現!這就代表,其實生物醫學論文要刊登,並不代表我們什麼錯都不能犯,相反地,這 20 個錯誤裡頭,有些就算犯了,也還是能被刊登。
⠀
以我們自己發表,以及過去協助同學的經驗來說,我會認為 2、7、10、14、15,是初學者也 #必須理解並避開的,其他的則是發表起步了之後,陸陸續續去注意,在往更高分期刊挑戰時,逐漸進步就行。
⠀
實務上,3 分以下的醫學期刊,幾乎沒有專門的統計查核,你只要能通過「一般同行」的統計知識審查就行。也就是說,我是一個放射科醫師,剛開始起步,投稿到放射科 3 分以下期刊,文章中的統計,只要「#一般有在做研究的放射科醫師」覺得可以就行,不見得要到「統計專家看過並挑不出毛病」。
⠀
對於初學者如何起步,實務的協助,新思惟規劃了各種類型的研究課程,歡迎有興趣的朋友可以參考。目前正在開放報名中的,有以下三場工作坊,歡迎您瞭解各課程的課綱後,評估挑選最符合您需求的內容,前來上課,讓我們協助您成功起步。
⠀
🟠 2021 / 11 / 7(日)統合分析工作坊
無經費、資源少也能發表,不用 IRB 且免收案的好選擇。
https://meta-analysis.innovarad.tw/event/
⠀
🔵 2021 / 10 / 17(日)臨床研究與發表工作坊
全新改款!跟著國際學者走,讓你寫作投稿都上手。
https://clip2014.innovarad.tw/event/
⠀
🟢 2021 / 10 / 16(六)個案報告、技術發表與文獻回顧工作坊
把臨床上的各種想法,在 PubMed 化作專業生涯上的里程碑。
https://casereport.innovarad.tw/event/
⠀ ⠀
不只是說說而已,我們會舉實例,說明其意義、如何避開,在互動實作過程,實際由各位在自己的電腦上操作,從數據到軟體,從統計到繪圖,一次搞定,並避開常見錯誤,是真正以 #初學者起步 為核心的規劃。
⠀
⠀
二十個常見的統計錯誤,與實務寫作時的考量。
🔗 原始貼文 │ https://bit.ly/2WESphu
sample mean統計 在 Herman Yeung Facebook 的最讚貼文
文中前部分︰
"食朱古力愈多的國家,產生諾貝爾獎得主的機會愈大,兩者在統計學上關聯極強,純屬巧合的機率僅萬分之一"
但文中後部分︰
"據BBC稱,當中亦有極少吃朱古力的例子。作為調查中一個異例,瑞典的人均朱古力消耗量僅及瑞士約一半,卻仍有很高比率的諾獎得主"
這兩點有沒有前後矛盾?
當然沒有,一個係話有極強的相關性,但 exceptional cases 仍然會發生,就正如一粒正常的骰仔,擲到 "6" 的機率係 1/6,
即係擲 60000 次,平均會有 10000 次出現 "6"
有無機會出現其他可能,當然有機會,例如出現 9999 次、10001 次的情況,大家都唔會覺得奇怪。
正態分佈的出現
實際出現的次數,其實係一個分佈圖,mean平均會係 10000,而佢有機會偏差於 10000,偏差得愈遠,機會會愈低,形成一個分佈,即係出現一些好離譜的情況 (e.g. 100 次) 其實都會出現,只係機率低好多。這個是正態分佈的第一個 level,數學 core 的同學都要明白。但這個世界唔會咁簡單。
如果個 cases 倒轉,我地唔知粒骰是否有古惑,利用擲 60000之的方法測試出現多少次 "6",後期發現只出現 5000 次 "6",咁我地可唔可以定呢粒骰係出千骰仔?呢種的問題會於 數學的 M1 出現,表面上,偏離 10000 愈遠,出現機率就愈低,但仍然有出現的機率,所以佢係唔係出千骰,答案都只係有機會,M1的同學就要學習如何計出係出千的機率。
這個技術亦適用於競選前的預測,奧巴馬大戰羅姆妮 一戰中,未有結果之前,各傳媒都會有選前預測,但測出的結果是否正確,例如調查結果係 45% 支持奧、55% 支持羅,這個是否可信?當然唔可信。唔係因為驚選民轉軚,而係驚你所選的樣本 sample 中與 population 總體的結果有所偏差,所以懂 statistics 的分析員就可以從數字中,計算出其實奧不是必敗,佢會有一定程度的百分比勝出,這個結果有什麼用途?用於一些賭博有關的事上,賠率可以為買羅勝出者 1 賠 1.01,盡信調查結果的人會願意買這個低的賠率,但對於開賭者的期望收益仍然為正數。
當然,統計學亦不止用於賭博上。佢亦應用於風險管理上,例如一個人出意外的概率為係統計學上一個討論範疇,因為保險就係用人命作賭注的賭博遊戲,保險公司其實係全世界最大的合法賭博公司,其收益可比美馬會。只要計好賠率,他的生意係穩賺,所以佢願意用天價請精算師幫佢地做分析,亦令全港學生誤以為精算師的前途無限。
精算師是否前途無限,這個又係期望值的 issue,如果全世界有名的保險公司只有 100 間,而每間只需要幾個精算師,而讀精算的學生每年全球數以萬計,有幸雀屏中選的話,收入為天價,但名落孫山的就要做沒有相關的工作了,博唔博得過,你自己決定啦。
http://hk.news.yahoo.com/人均朱古力進食量-與諾獎成正比-211718809.html
sample mean統計 在 コバにゃんチャンネル Youtube 的精選貼文
sample mean統計 在 大象中醫 Youtube 的最讚貼文
sample mean統計 在 大象中醫 Youtube 的最讚貼文
sample mean統計 在 「機率與統計」05-04「抽樣分佈:Distribution of the sample ... 的推薦與評價
「機率與 統計 」05-04「抽樣分佈:Distribution of the sample mean 」. 377 views377 views. Aug 16, 2019. 1. Dislike. Share. Save. ... <看更多>
sample mean統計 在 生物統計學:常讓人誤解的標準誤 - Facebook 的推薦與評價
「要講標準誤,一定要先知道平均數的抽樣分佈(sampling distribution of the mean)。」 健健說:這是什麼,我不懂。 「沒關係,讓我試著講解給你知道。」老師說。 ... <看更多>
sample mean統計 在 「機率與統計」05-05「抽樣分佈:A sample mean experiment」 的推薦與評價
「機率與 統計 」05-05「抽樣分佈:A sample mean experiment」. 254 views Aug 16, 2019 國立臺灣大學資訊管理學系孔令傑 … ...more ...more. ... <看更多>